Model Selection

Multi-Task Unified Framework

# Multi-Task Unified Framework

Lotus Depth D V1 0

Lotus is a diffusion-based vision foundation model focused on high-quality dense prediction tasks.

Blip Image Captioning Base Football Finetuned

A vision-language model pre-trained on COCO and fine-tuned on a football dataset, proficient in generating image captions

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase